Google Rilis DiffusionGemma, Model AI Open Source yang Diklaim 4 Kali Lebih Cepat
Google DeepMind meluncurkan DiffusionGemma, model kecerdasan buatan (AI) open source terbaru yang mampu menghasilkan teks hingga empat kali lebih cepat
Persaingan pengembangan kecerdasan buatan semakin memanas. Setelah sukses dengan keluarga model Gemma, Google DeepMind kini memperkenalkan DiffusionGemma, sebuah model AI eksperimental yang menggunakan pendekatan berbeda dari chatbot dan model bahasa besar (LLM) pada umumnya.
Jika model AI konvensional menghasilkan teks satu per satu secara berurutan, DiffusionGemma mampu menghasilkan blok teks secara paralel sehingga proses generasi menjadi jauh lebih cepat. Google mengklaim teknologi ini dapat menghasilkan teks hingga empat kali lebih cepat dibanding model Gemma yang menggunakan metode autoregressive tradisional.
Apa Itu DiffusionGemma?
Selama ini sebagian besar model AI generatif bekerja dengan cara memprediksi kata berikutnya berdasarkan kata sebelumnya. Metode ini efektif tetapi memiliki keterbatasan karena prosesnya harus dilakukan secara berurutan.
DiffusionGemma mengadopsi pendekatan yang selama ini populer pada generator gambar AI seperti Stable Diffusion. Model tidak lagi menghasilkan kata satu per satu, melainkan membuat dan menyempurnakan sejumlah token secara bersamaan dalam satu proses. Dengan metode tersebut, kecepatan pemrosesan meningkat signifikan.
Google menjelaskan bahwa DiffusionGemma dapat menghasilkan lebih dari 700 token per detik pada GPU NVIDIA RTX 5090 dan menembus 1.000 token per detik pada GPU NVIDIA H100.
Mampu Mengoreksi Kesalahan Sendiri
Keunggulan lain yang ditawarkan DiffusionGemma adalah kemampuan melakukan koreksi secara real-time selama proses generasi berlangsung.
Pada model bahasa konvensional, kesalahan yang muncul pada awal kalimat biasanya akan terbawa hingga akhir. Sebaliknya, DiffusionGemma dapat meninjau kembali dan memperbaiki token yang telah dihasilkan melalui proses denoising berulang.
Kemampuan ini membuat model lebih cocok digunakan untuk berbagai kebutuhan seperti:
- Pengeditan teks secara langsung.
- Penyempurnaan kode pemrograman.
- Code infilling atau mengisi bagian kode yang hilang.
- Penyelesaian masalah yang membutuhkan konsistensi global dalam satu dokumen.
Lebih Ringan untuk GPU Konsumen
Google juga merancang DiffusionGemma agar dapat dijalankan pada perangkat yang lebih terjangkau.
Model ini merupakan model berukuran 26 miliar parameter dengan arsitektur Mixture of Experts (MoE), tetapi saat inferensi hanya mengaktifkan sekitar 3,8 miliar parameter. Dalam kondisi terkuantisasi, model dapat berjalan pada GPU dengan kebutuhan memori sekitar 18 GB VRAM.
Hal tersebut membuka peluang bagi pengembang independen, startup, maupun peneliti untuk menjalankan model AI canggih tanpa harus menggunakan infrastruktur komputasi yang sangat mahal.
Open Source untuk Pengembang
Google merilis DiffusionGemma dengan lisensi Apache 2.0 dan menyediakan bobot model (weights) bagi komunitas pengembang untuk melakukan eksperimen, modifikasi, maupun fine-tuning sesuai kebutuhan.
Langkah ini melanjutkan strategi Google dalam memperluas ekosistem AI terbuka melalui keluarga model Gemma yang telah mencatat jutaan unduhan sejak pertama kali diperkenalkan.
Belum Mengungguli Gemma 4 dalam Kualitas
Meski menawarkan kecepatan yang jauh lebih tinggi, Google mengakui kualitas keluaran DiffusionGemma saat ini masih berada di bawah model Gemma 4 pada sejumlah benchmark.
Karena itu, DiffusionGemma diposisikan sebagai model eksperimental yang lebih cocok untuk kasus penggunaan tertentu yang membutuhkan respons sangat cepat, sementara Gemma 4 tetap menjadi pilihan utama untuk aplikasi yang mengutamakan kualitas hasil.
Kehadiran DiffusionGemma menunjukkan bahwa industri AI mulai mengeksplorasi pendekatan baru selain model autoregressive yang selama ini mendominasi pasar. Jika teknologi diffusion untuk teks terus berkembang, bukan tidak mungkin generasi berikutnya dari AI akan mampu memberikan respons yang jauh lebih cepat sekaligus lebih akurat.





